کاربرد الگوریتم های داده کاوی در تشخیص داده های ژئوشیمیایی خارج از ردیف چند متغیره

نویسندگان

چکیده مقاله:

تشخیص داده‌های خارج از ردیف چند متغیره به کمک الگوریتم‌های داده‌کاوی یکی از نکات ضروری پیش‌پردازش داده‌های اکتشافات ژئوشیمیایی محسوب می‌شود. در این مقاله چهار الگوریتم برآورد چگالی کرنل (KDE)، ضریب خارج از ردیف بودن محلی (LOF)، OPTICS-OF و SVDD که به ترتیب جزو روش‌های آماری، روش‌های مبتنی بر مجاورت، روش‌های مبتنی بر خوشه‌بندی و روش‌های مبتنی بر دسته‌بندی هستند، معرفی شده و کاربرد آنها بر روی داده‌های ژئوشیمیایی ورقه 100000/1 روم با ماتریس داده 41×902 بررسی شده است. برای این منظور ابتدا روش ilr برای باز کردن سیستم عددی داده‌ها بکار رفته و سپس داده‌ها در بازه صفر تا یک استاندارد شده است. نتایج پیاده شده چهار الگوریتم فوق بر روی مجموعه داده‌های استاندارد شده، نشان می‌دهد که در رویکرد تشخیص نمونه‌های دارای خطا، 10 نمونه که دارای بالاترین احتمال خارج از ردیف بودن هستند و در هر چهار الگوریتم نیز یکسان می‌باشند را می‌توان برای بررسی بیشتر به عنوان نمونه‌های انتخابی برای نمونه‌برداری تکراری در نظر گرفت. در رویکرد تشخیص نمونه‌های غیر نرمال، از 150 نمونه‌ی انتخابی 5/74% از نمونه‌ها در هر چهار الگوریتم و 1/16% و 4/9% نیز به ترتیب در یک و دو الگوریتم به عنوان داده‌ی خارج از ردیف شناسایی شده است. مقایسه نتایج الگوریتم‌های انتخابی با روش کلاسیک فاصله ماهالانوبیتس نشان دهنده‌ی برتری آنها در هر دو رویکرد است. همچنین پیشنهادی می‌شود از الگوریتم‌های تشخیص داده‌های خارج از ردیف چند متغیره می‌توان برای تعیین نمونه-برداری‌های تکراری، محاسبه ماتریس موقعیت و پراکندگی در آمار چند متغیره مقاوم پس از حذف داده‌های غیر نرمال و تعیین آنومالی‌های ژئوشیمیایی استفاده کرد.

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

جداسازی داده های خارج از رده به روش تک متغیره و چند متغیره در داده های ژئوشیمی محدوده طلای اپی ترمال ساری گونای

داده‌های پرت در ژئوشیمی اکتشافی بسیار مهم هستند و می‌توانند اثرات زیادی بر نتایج روش‌های آماری از جمله جداسازی آنومالی از زمینه داشته باشند. بنابراین یکی از اولین مراحل پیش پردازش در تحلیل داده‌های ژئوشیمیایی، تشخیص و تصمیم‌گیری در مورد حذف یا تصحیح آن‌ها است. این داده‌ها را به 3 روش تک متغیره، دو متغیره و چند متغیره می‌توان شناسایی کرد که هدف از این تحقیق جداسازی آن‌ها با استفاده از روش‌های تک...

متن کامل

آنالیز داده های ژل های الکتروفورز دو بعدی با استفاده از روش های آماری چند متغیره

سابقه و هدف : در سـال های اخیـر تکنولـوژی مـربوط به تـوصــیف لکه های پروتئینی نمایان شده بر ژل های الکتروفورز دو بعدی، توسعه ی قابل ملاحظه ای یافته و نرم افزارهای متعدد آماری آنالیز ژل نیز ایجاد و گسترش یافته است که تأثیر این ابتکارات بر ارتقاء پروتئومیک بسیار چشمگیر است.آنالیز داده های عظیم پروتئومیکی با دارا بودن متغیر های زیاد نیاز به روش های چند متغیره است که امکان آنالیز آماری همزمان چندین...

متن کامل

داده کاوی و کاربرد آن در تصمیم‌گیری‌ها

ابهامات محیطی ناشی از مدل‌های نوین کسب و کار سبب تشدید پیچیدگی در تصمیم‌گیری، به‌ویژه در حوزه کسب و کار شده است. به‌طوری‌که بسیاری از متغیر‌های تاثیرگذار ناشناخته بوده و روابط میان آن‌ها نیز غیرخطی و پیچیده است. در چنین شرایطی دیگر نمی‌توان داده‌ها را با ابزارهای سنتی تحلیل نموده و از آن‌ها دانش استخراج کرد. از این روی مقاله حاضر به تشریح تکنولوژی داده کاوی در حوزه هوش محاسباتی و متدولوژی استا...

متن کامل

جداسازی داده های خارج از رده به روش تک متغیره و چند متغیره در داده های ژئوشیمی محدوده طلای اپی ترمال ساری گونای

داده­های پرت در ژئوشیمی اکتشافی بسیار مهم هستند و می­توانند اثرات زیادی بر نتایج روش­های آماری از جمله جداسازی آنومالی از زمینه داشته باشند. بنابراین یکی از اولین مراحل پیش پردازش در تحلیل داده­های ژئوشیمیایی، تشخیص و تصمیم­گیری در مورد حذف یا تصحیح آن­ها است. این داده­ها را به 3 روش تک متغیره، دو متغیره و چند متغیره می­توان شناسایی کرد که هدف از این تحقیق جداسازی آن­ها با استفاده از روش­های تک...

متن کامل

استفاده از تکنیک های داده کاوی جهت تشخیص دیابت با استفاده از چربی خون

مقدمه: بیماری دیابت یکی از شایع ترین، خطرناک ترین و پرهزینه ترین بیماری های حال حاضر دنیا است که با نرخ هشدار دهنده ای در حال افزایش است. استفاده از روش‌ های داده‌ کاوی می تواند به تشخیص زودهنگام دیابت کمک کند که باعث جلوگیری از پیشرفت این بیماری و خیلی از عوارض آن مانند بیماری قلب و عروق، مشکلات بینایی و بیماری های کلیوی می شود. مواد و روش ها: در این تحقیق از نرم افزار داده کاوی رپیدماینر برای...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 14  شماره 45

صفحات  63- 82

تاریخ انتشار 2020-02-20

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023